Recherche de similarités dans les séquences d'ADN : modèles et algorithmes pour la conception de graines efficaces
نویسنده
چکیده
Most commonly used similarity search methods in genomic sequences are heuristic ones.These are based upon text ltering that allows one to infer potential regions of similarity. Thisthesis proposes new lter de nitions to search for similarities in genomic sequences, and fastalgorithms to measure the e ciency of these lters.More precisely, we study the spaced seed model and propose an algorithm to measure the seede ciency on similarities of a certain kind, called homogeneous similarities. A generic algorithmhas also been developed to measure the seed e ciency, together with an extension of the spacedseed model called subset seed. Finally, we propose and analyze a multi-seed approach in theframework of lossless ltration, and apply it to the problem of oligonucleotide design.Several software tools have been developed to search for similarities as well as to designseed-based lters.
منابع مشابه
Champs de Markov conditionnels pour le traitement de séquences
Résumé. Les modèles conditionnels du type modèles de Markov d’entropie maximale et champs de Markov conditionnels apportent des réponses aux lacunes des modèles de Markov cachés traditionnellement employés pour la classification et la segmentation de séquences. Ces modèles conditionnels ont été essentiellement utilisés jusqu’à présent dans des tâches d’extraction d’information ou d’étiquetage m...
متن کاملثبت اختراعات دارویی و بررسی چالش های حقوقی آن
La protection des produits pharmaceutiques par le droit des brevets est aujourd’hui un sujet brûlant, notamment en raison du progrès spectaculaire que connaît depuis quelques années le domaine de la biotechnologie. En générale, les brevets pharmaceutiques sont nécessaires pour stimuler la recherche de nouveaux médicaments plus efficace...
متن کاملViolence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant
L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...
متن کاملTableau de bits indexé (TBI) pour la recherche de séquences fréquentes
A la différence de la fouille d’articles fréquents, la recherche de sous-séquences fréquentes tient compte de l’apparition multiple et de l’ordre des articles. L’algorithme proposé parcourt la base de données une seule fois. Durant cette passe, il construit un vecteur VS contenant toutes les combinaisons de séquences présentes dans la base. A ce vecteur est associé un tableau de bit TB codant t...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کامل